Dialéctica del alineamiento: conocimiento inseguro para enrutamiento dinámico
SafeMoE aprovecha conocimiento inseguro para respuestas seguras e informativas, superando en un 20% la tasa de seguridad. Un nuevo paradigma en alineamiento.
SafeMoE aprovecha conocimiento inseguro para respuestas seguras e informativas, superando en un 20% la tasa de seguridad. Un nuevo paradigma en alineamiento.
AffordGen genera datos diversos para manipulación robótica con generalización zero-shot. Aumenta la eficiencia del aprendizaje por imitación.
DIBS: clonación conductual desacoplada para generalización inductiva escalable en RL con entrenamiento estable y rendimiento zero-shot.